首页> 外文OA文献 >A dynamic game approach to distributionally robust safety specifications for stochastic systems
【2h】

A dynamic game approach to distributionally robust safety specifications for stochastic systems

机译:一种动态游戏方法,可实现分布式强大的安全规范   对于随机系统

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This paper presents a new safety specification method that is robust againsterrors in the probability distribution of disturbances. Our proposeddistributionally robust safe policy maximizes the probability of a systemremaining in a desired set for all times, subject to the worst possibledisturbance distribution in an ambiguity set. We propose a dynamic gameformulation of constructing such policies and identify conditions under which anon-randomized Markov policy is optimal. Based on this existence result, wedevelop a practical design approach to safety-oriented stochastic controllerswith limited information about disturbance distributions. This control methodcan be used to minimize another cost function while ensuring safety in aprobabilistic way. However, an associated Bellman equation involvesinfinite-dimensional minimax optimization problems since the disturbancedistribution may have a continuous density. To resolve computational issues, wepropose a duality-based reformulation method that converts theinfinite-dimensional minimax problem into a semi-infinite program that can besolved using existing convergent algorithms. We prove that there is no dualitygap, and that this approach thus preserves optimality. The results of numericaltests confirm that the proposed method is robust against distributional errorsin disturbances, while a standard stochastic safety specification tool is not.
机译:本文提出了一种新的安全规范方法,该方法对干扰概率分布中的错误具有鲁棒性。我们提出的分布式鲁棒安全策略最大程度地使系统始终保持在所需集中的概率,这取决于歧义集中最坏的扰动分布。我们提出了构建此类策略的动态博弈公​​式,并确定了非随机马尔可夫策略最优的条件。基于这一存在的结果,我们开发了一种关于面向安全的随机控制器的实用设计方法,该方法的扰动分布信息有限。此控制方法可用于最小化另一个成本函数,同时以概率方式确保安全。但是,由于扰动分布可能具有连续的密度,因此相关的Bellman方程涉及无限维的minimax优化问题。为了解决计算问题,我们提出了一种基于对偶的重新制定方法,该方法将无穷维极大极小问题转换为可以使用现有收敛算法求解的半无穷程序。我们证明不存在对偶间隙,并且该方法因此保留了最优性。数值测试结果表明,该方法对扰动中的分布误差具有鲁棒性,而标准的随机安全规范工具则没有。

著录项

  • 作者

    Yang, Insoon;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号